Introducción

El deterioro cognitivo leve (DCL) es una condición en la que las personas experimentan una disminución en sus habilidades cognitivas mayor a la esperada para su edad, sin que esto interfiera significativamente con su vida diaria. Aunque el DCL puede mantenerse estable durante años, es una señal de alerta porque puede progresar a enfermedades más graves, como la enfermedad de Alzheimer. El Alzheimer es la causa más común de demencia, se caracteriza por la acumulación de proteínas anormales en el cerebro, que dañan las neuronas y causan pérdida de memoria y otras capacidades cognitivas avanzadas. Estos cambios comienzan mucho antes de que los síntomas sean evidentes, por lo que la detección temprana es crucial.

Preguntas de Investigación

Para nuestra investigación, vamos a abordar las siguientes preguntas clave:

Asociación con Patologías Neurodegenerativas:

  • ¿Cuáles de las variables morfológicas del cerebro están más asociadas con el DCL y el Alzheimer?

Predictores Demográficos:

  • ¿Qué características demográficas (como la edad y el sexo) pueden predecir los valores de estas variables morfológicas?

Impacto de la Tecnología:

  • ¿Hay alguna relación entre las características tecnológicas (como la marca del resonador y la intensidad del campo magnético) y las variables morfológicas que estamos interesados en estudiar?

Abordaje

Para abordar este problema, primero realizaremos un análisis exploratorio de datos para entender mejor la distribución y las características de las variables disponibles. Posteriormente, utilizaremos un enfoque bayesiano en nuestro análisis para ajustar y comparar modelos para identificar las relaciones entre variables morfológicas del cerebro, características demográficas y el riesgo de desarrollar DCL o Alzheimer. Al evaluar la importancia de cada variable en la predicción de estas condiciones, podremos seleccionar el mejor modelo que represente los datos y las relaciones de manera más precisa. Nuestro objetivo final es mejorar nuestra comprensión de los factores que contribuyen al desarrollo de enfermedades neurodegenerativas.

Descripción del Conjunto de Datos

Utilizamos el conjunto de datos llamado cerebros.csv. Este conjunto incluye información de 128 pacientes que se sometieron a estudios de resonancia magnética en diferentes partes del mundo. Las variables en este conjunto de datos son:

  • id: Identificación del paciente.

  • intensidad_campo: Intensidad del campo magnético utilizado en la imagen (puede ser 3 T o 1.5 T). Sabemos que a mayor intensidad, se obtiene información más detallada de los pacientes.

  • resonador_fab: Marca del resonador (Phillips, Siemens, General Electric).

  • edad: Edad del paciente (en años).

  • sexo: Sexo del paciente.

  • diag: Diagnóstico, que puede ser HC (control sano), MCI (deterioro cognitivo leve) o AD (enfermedad de Alzheimer).

  • lh_subcx_hippocampus_volume: Es la medida del tamaño del hipocampo en el hemisferio izquierdo del cerebro (en mm³).

Imagen 1: Hipocampo

Imagen 2: Hipocampo
  • xh_general_etiv_volume: Volumen intracraneal. Es el volumen total dentro del cráneo, incluyendo el cerebro, el líquido cerebroespinal y otros componentes (en mm³).

Imagen 3: Volumen intercraneal
  • lh_cortex_superiorfrontal_thickness: Espesor de la corteza superior frontal. Es la medida del grosor de la corteza cerebral en la región superior del lóbulo frontal (en mm).

Imagen 4: Corteza frontal superior
  • lh_cortex_fusiform_volume: Volumen de la corteza fusiforme, una región del cerebro situada en el lóbulo temporal. (en mm³).

Imagen 5: Corteza Fusiforme

Analisis Exploratorio

En primer instancia se realizo un auto EDA para elegir relaciones de interes y presentarlas con mayor profundidad. De alli surgió el interes en la variable/relaciones

Analisis Exploratorio

Analisis Exploratorio

Diagnóstico vs Fábrica del resonador

\(H_0)\) Las dos variables categóricas son independientes. Esto significa que la distribución de una variable es la misma en todas las categorías de la otra variable.

\(H_1)\) Las dos variables categóricas no son independientes. Esto significa que la distribución de una variable es diferente en al menos una categoría de la otra variable.


    Pearson's Chi-squared test

data:  contingency_table
X-squared = 38.807, df = 4, p-value = 7.637e-08

Propuesta y ajuste de modelos

Descripción matemática

Considerando que nuestro interes esta en explicar que variables muestran o dan indicio de predisposicion a desarrollar una enfermedad neurodegenerativa, analizaremos nuestra respuesta enfermedad como una variable binaria que toma el valor 1 si el paciente tiene una enfermedad, o 0 si su control resultó sano.

Modelaremos enfermedad como la respuesta de una regresión logística. Los modelos que nos ayudan a responder los objetivos son los siguientes.

Modelado

\[Enfermedad_i | \pi_i \sim Bernoulli(\pi_i) \]

\[logit(\pi_i) = \beta_0 + \beta_1 . \text{Vol Hipocampo}_i + \beta_2 . \text{Espesor Corteza Sup Frontal}_i +\] \[+ \beta_3. \text{Vol Corteza Fusiforme}_i + \beta_4. \text{Vol Intracraneal}_i\]

\[Enfermedad_i | \pi_i \sim Bernoulli(\pi_i) \]

\[logit(\pi_i) = \beta_0 + \beta_1 . Edad_i + \beta_2 . Sexo_i\]